class Config:
    n_layers = 6  # 编码，解码的层数

    heads_number = 8  # 多头注意力 多头数量

    model_dimension = 512  # 单个词的特征数量  每一个字符转化成Embedding的大小

    d_k = 64  # 多头维度  model_dimension//heads_number

    d_v = 64  # 多头维度  model_dimension//heads_number

    d_ff = 2048  # 前馈中间扩展维度

    dropout = 0.1

    # _________________________________________________

    src_context_length = 64  # 输入文本长度

    tgt_context_length = 64  # 输出文本长度

    epoch = 300  # 训练批次

    batch_size = 20  # 批处理数量

    lr= 0.001

